科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网CIO与应用频道大视野看银行数据管控

大视野看银行数据管控

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

主题为“新银行 新蓝海”的2014年中国银行业座谈研讨会在青岛召开,文思海辉技术有限公司助理副总裁熊琳介绍了银行如何进行数据管控。

来源:ZDNet CIO与应用频道 2014年7月14日

关键字: 大数据 数据管控 文思海辉

  • 评论
  • 分享微博
  • 分享邮件

ZDNET至顶网CIO与应用频道 07月14日 综合消息:主题为“新银行 新蓝海”的2014年中国银行业座谈研讨会在青岛召开,文思海辉技术有限公司助理副总裁熊琳介绍了银行如何进行数据管控。

数据管控从银行角度有四层架构:战略、机制、领域、实现。我们一定会觉得企业的战略决定了业务的架构、应用架构、技术架构。所以,数据架构在整个流程里面是处于比较关键位置的。第二层,数据管控方面有组织架构、工作流程跟管理制度。熊琳表示,“很多行做完了数据标准和数据管控之后,实际上并没有成立专门的部门跟人员跟进,就是咨询公司把一堆文档放在那之后,这个行在数据管控领域的工作依然回到了原来的状况。”

大视野看银行数据管控

文思海辉技术有限公司助理副总裁熊琳

以下为演讲实录:

在大数据环境下,给了我们三个思考:第一,我们通常习惯在数据分析的时候使用样本数据,因为以前数据采集、数据存储跟数据加工的成本比较高,所以我们在做数据分析的时候基本上喜欢用采样数据,这也就造就了统计学的发展,但现在这个成本降低了,比如说我们现在各种各样的穿戴设备,还有模拟数字怎么转换成数字信息,这些将以前不可能获取的信息变成了可获取的数据,采集成本低了,存储成本也低了,-以前银行说建数据仓库,都是针对银行内部自己的数据,而今天由于爬虫及相关技术的发展,我们获取外部数据的成本降低,技术上也可行,,所以我们可以跳出自己内部看外部数据哪些能够为我所用。。

但有人会说我们自己数据都没用好的前提下我们需不需要看外面的数据?我觉得这是辩证的,你一定要两条腿走路,你一方面要把自己的数据用好,也要看外面的数据。尤其是将来利率市场化,利率市场化只是关起门来看资本介入的成本,不去考虑外面同业怎么定价的也不行,所以我们有必要去外面通过爬虫技术,爬各种产品的数据过来。

另外,我们以前更喜欢用的是结构化数据,但我们在银行内部还有大量的非结构化数据,比如呼叫中心的录音,电子银行的点击流,这些都是非结构化数据,那我们如何把它转换成结构化数据,以帮助提升客户的体验?这也是银行要做的。如果做这个的话势必会对数据管控带来新的冲击,因为我们原来是基于银行自己结构化的小数据做的,对于数据管控理论我们也要转型。

第二个需要思考的点是我们以前都讲究精准,我记得很清楚,应该在06、07年,我从银行业到通讯行业去做营销,我对那个大宽表的变量精益求精的的时候,运营商的领导说这个数据用于营销有70、80%的准确度就行了,当时这对我们银行业十几年的从业者根本是不能接受的,银行是少了一分钱都不能关帐的行业,同时银行也是一个重风险的行业,所以准确和容错这两个矛盾的东西我们如何去平衡。今天也有嘉宾说到,我们要容错,所以我们有必要把数据进行分类,比如说如果我做客户营销,所谓的精准营销只是相对以前拍脑袋去做营销要精准一点,但相对风险管控那种精准又是可以容错的。像零售业务可以通过大样本数据修正一些错误的数据,但是对于批发业务,比如像大公司的贷款,对公司类的授信数据,你的精准等级就要定高,这是我们在指导我们做银行数据管控的时候需要注意的一点。

第三点的思考是我们在用大数据结果的时候不要过于注重因果关系的推理,而是要接受关联关系的结论,举个例子,橙汁和阿司匹林在一起对治疗癌症有帮助,这是从大量数据中统计的结果,我们可以直接用这个结果来辅助治疗癌症,但是如果要等因果关系搞清楚,可能需要几十年的研究才能搞明白,同样有个哈姆雷特项目,项目发起人当时发现自己购买机票比别人的价格要高,再问其他的人,还有比他要高的,所以启发他做个应用来预测当前价格是否最低,这个应用就以从网上能够扒下来的4个月的12000个价格样本为依据进行预测,而不是从因果关系去构建相关变量,如果要分析机票价格和季节、节假日等众多变量的关系,可能这个项目要很长时间才能完成,到2012年这个项目已经累计了十万亿条价格纪录来帮助预测,预测的准确度有75%以上,使用Farecast票价预测工具购买机票的旅客,平均每张机票可节省50美元,慢慢随着数据的积累,准确度会越来越高。同样我们在银行做一些流失模型、交叉销售等模型的时候也可以借鉴这个思路。前一阵子我也被莫名其妙拉进了大数据专家群,因为这里有一些互联网界大牛,每天大家都讨论的很热烈,我就问了大家一个问题,大家是否思考过大数据的管控?顿时群里就很寂静了,携程的一位专家就跳出来@我,他说数据管控这套体系只能在一些特殊行业才能运用。还有些人-问,什么叫数据管控?很多专家今天也分享了很多经验,我们在银行业也有自豪的地方,我们沉淀的七八年时间的数据管控也是比较成熟的和先进的,在欣赏互联网行业的同时要能够客观看待自身行业的特点和长处。由于时间有限,所以只能蜻蜓点水的给大家过一下。

数据管控来讲有四层架构:战略、机制、领域、实现。所谓的战略是这样的,我企业的战略决定了业务的架构、应用架构、技术架构。所以,数据架构在整个流程里面是处于比较关键位置的。第二层,我们的数据管控,软的方面有组织架构、工作流程跟管理制度。很多行做完了数据标准和数据管控之后,实际上并没有成立专门的部门跟人员跟进,就是咨询公司在项目结束后把一堆文档交差,这个行在数据管控领域的工作依然回到了原来的状况。所以,一般我们会跟行领导一开始就强调,这个项目做完之后你一定要成立相应的组织架构。做数据管控人员的基本要求还比较高,又要懂业务又要懂技术。第二块,你有了人、有了岗位之后,他们的工作流程是什么。第三个是要有管理制度。

还有一些行领导也比较重视,组织架构也成立好了,流程也划好了,但是没有抓手,没有考核办法,如果没有考核办法各个部门都是以发展业务为主,所以基本上是没有人理你什么数据管控的。在一家股份制银行考核把5分专门给了数据管控,这就是我们说的抓手。

这是我们分的三层,刚才讲的重要的数据架构在这里,然后是数据标准,你老说数据质量好与坏,首先必须要有个标准在那告诉别人,什么叫好的数据、什么叫不好的数据。元数据管理,因为今天的参会者都是科技的多,元数据这块肯定是科技的职责,对系统的变更都能够管理起来。这个数据质量是什么?数据质量管理就是从后端看应用系统质量能不能达到要求。

第四层架构是数据管控的实现,这块一直就是我们强调的理念,数据标准并不仅仅只在中后台落地,而是从原系统开始就要落地,一直贯穿到数据后台应用,只有这样数据管控才能真正实现。因为数据是比较繁杂的,所以我们必须要有管控工具、数据标准管理平台,都是来支撑我们的数据管控工作的工具。

数据管控的组织架构,实际是一直非常非常有争议的,每次我们做这样的数据管控项目的时候,因为这是个比较新的领域,有些行就认为应该是科技承担这部分责任,有些行认为业务承担这部分责任,有的行认为科技、业务都做不了。的确是这样,我们认为每家行要在全行层面有一个由行领导牵头的数据管控委员会,只有这样才能拿到考核管理制度,有了这种支持之后,其实数据管控分两块:有偏业务的、有偏技术的。偏业务主要是牵头业务领域的东西,为什么质量管理也放在业务组呢?因为我们对外的报送,比如对监管,还有对人民银行、上市公司对外的报送,实际都是由业务部门报的,而不是由科技部门报出去的。数据质量管理,在一些行里也是放在偏业务这块。

技术这块的作用也是挺大的,数据架构的管理肯定是在科技这边,安全的管理,这个安全是属于信息密集程度,这个信息是不是可以公布出来给不同角色的人看的。数据标准跟数据质量,科技都是属于配合业务的角色,下面的业务部门都有标准和质量管理,所以数据管控是全行参与类似做业务一样的组织架构,只有这样整个数据管控才能运转起来。

工作流程,这些人已经定了,比如说我的标准的提出,要经过哪个部门去审批,制定这个标准,我们一直强调不是一个部门来制定全行的标准,也分哪个业务标准由哪个部门制定。这是管控委员会跟管办公室的职能,比较细。这张片子可以好好讲一下,大家知道数据管控工作比较烦琐,那我们要尽量把数据管控工作抽项分类,我们把数据产生跟数据应用的流程当中,我们把不同的部门都进行分类,其中有业务的属主部门、系统的属主部门、系统的操作、系统的应用,因为每个角色包括IT部门,造成的数据质量好坏都是相关的,所以我们要进行分类。这里是针对银行所有的系统进行了分类,这是我们的标准制定流程、标准应用流程,这是数据质量,出现了问题我们如何解决问题的流程,其中的颜色也是按照不同的对象在里面所起的作用而分配的。这就是我们所说的,数据质量评分卡,既然我们有考核制度,那我们要有能够说得清楚、说得白的考核办法,这些是一些量化指标。

最后总结一下,我们作为银行,在现在这个大数据的环境,我们一定要用开放的心态去接受大数据给我们带来的冲击,但我们要做一些深度思考。就是说,银行也有我们自己的一些长处和特点,哪些我们可以去尝试,我们必须务实踏踏实实找到一些切入点,否则时间很快就过去了,再好的浪潮跟你也没有任何的关系。另外,数据管控的工作很复杂,很烦琐,但我们一定要抽项归类提炼出来,形成一套可落地的数据管控方法,帮助相关部门去落地。

    • 评论
    • 分享微博
    • 分享邮件
    闂傚倸鍊搁崐鎼佸磹閹间礁纾瑰瀣椤愪粙鏌ㄩ悢鍝勑㈤柣顓燁殜楠炴牕菐椤掆偓婵¤偐绱掗幇顓ф疁闁哄矉绻濆畷鍫曞煛娴i攱鐫忛梻浣告惈椤戝懘鏌婇敐澶婅摕闁哄浄绱曢悿鈧柣搴秵娴滅偞绂掗悙顒傜瘈婵炲牆鐏濋悘鐘绘煏閸喐鍊愮€殿喖顭峰鎾晬閸曨厽婢戦梺璇插嚱缂嶅棙绂嶉弽顓炵;闁规崘顕ч崘鈧銈嗘尪閸斿海绮欒箛娑欌拺閻犳亽鍔屽▍鎰版煙閸戙倖瀚�

    濠电姷鏁告慨鐑藉极閸涘﹥鍙忛柣鎴濐潟閳ь剙鍊圭粋鎺斺偓锝庝簽閸旓箑顪冮妶鍡楀潑闁稿鎹囬弻娑㈡偄闁垮浠撮梺绯曟杹閸嬫挸顪冮妶鍡楀潑闁稿鎸剧槐鎾愁吋閸滃啳鍚Δ鐘靛仜閸燁偉鐏掗柣鐘叉穿鐏忔瑧绮i悙鐑樷拺鐟滅増甯掓禍浼存煕閹惧娲撮柟顔藉劤鐓ゆい蹇撴噳閹锋椽姊婚崒姘卞闁告娲熷畷濂稿Ψ閵壯勭叄婵犵數濮撮敃銈団偓姘煎弮瀹曪綀绠涢弮鍌滅槇婵犵數濮撮崐缁樻櫠濞戙垺鐓曢悗锝冨妼婵′粙鏌曢崶褍顏€殿喕绮欐俊姝岊槹闁逞屽墯鐢繝寮婚悢鍏煎癄濠㈣泛锕ュ▓濠氭⒑閸濆嫮鐏遍柛鐘崇墵楠炲啫饪伴崼婵堝幐闂佺ǹ鏈粙鎾广亹鐎n喗鐓熼幖娣€ゅḿ鎰箾閸欏顏堟偩濠靛牏鐭欓悹鎭掑妽濞堥箖姊洪崜鎻掍簼婵炲弶鐗犻幃鈥斥槈閵忥紕鍘遍柣蹇曞仜婢т粙鎯岀€n偆绠鹃柛顐ゅ枑閸婃劖鎱ㄦ繝鍕笡闁瑰嘲鎳愮划鐢碘偓锝庝簼閻d即姊绘担瑙勫仩闁告柨顑夊畷锟犲礃閼碱剚娈鹃梺闈涚箞閸婃洟宕橀埀顒€顪冮妶鍡楀闁稿骸宕惃顒勬⒒閸屾瑧鍔嶉悗绗涘懐鐭欓柟瀵稿Л閸嬫挸顫濋悡搴$睄閻庤娲戦崡鍐茬暦閸楃倣鐔兼⒐閹邦喚娉块梻鍌欑窔濞佳囨偋閸℃稑绠犻幖娣灪閸欏繑銇勯幒鍡椾壕闂佸疇顫夐崹鍧楀春閵夆晛骞㈡俊鐐插⒔閸戣绻濋悽闈浶為柛銊︽そ閺佸鏌ч懡銈呬沪濞e洤锕俊鍫曞川椤斿吋顏¢梻浣呵归鍛村磹閸︻厽宕叉繛鎴欏灩楠炪垺淇婇婵愬殭缁炬澘绉归弻锝嗘償閵忥絽顥濆銈忓閺佽顕g拠宸悑闁割偒鍋呴鍥⒒娴e憡鍟為柟鎼佺畺瀹曠増鎯旈…鎴炴櫔闂佹寧绻傞ˇ浠嬪极閸℃ぜ鈧帒顫濋濠傚闂佹椿鍘介〃鍡欐崲濞戙垹绠婚柡澶嬪灩閸斾即姊虹粙娆惧剱闁圭懓娲濠氭晲閸涱亝顫嶅┑鐐叉閸旀洜澹曢幎鑺モ拺闁告繂瀚﹢鎵磼鐎n偄鐏撮柛鈺冨仱楠炲鏁冮埀顒€顔忓┑鍥ヤ簻闁哄洨鍋為崳娲煃鐠囪鍔熺紒杈ㄦ崌瀹曟帒鈻庨幋婵嗩瀴婵$偑鍊戦崝宀勫箠濮椻偓楠炲棗鐣濋崟顐わ紲闂佺粯鍔欏ḿ褏绮婇敃鍌涚厵闁稿繗鍋愰弳姗€鏌涢弬璺ㄧ劯闁诡喚鍋ゅ畷褰掝敃閻樿京鐩庨梻浣告贡閸庛倝宕归悽鍓叉晜闁冲搫鎳忛崐鍨叏濮楀棗澧绘俊鎻掔秺閺屾洟宕惰椤忣厾鈧鍠曠划娆愪繆濮濆矈妲奸梺闈╃祷閸庡磭妲愰幘瀛樺缂佹稑顑呭▓顓炩攽閳藉棗浜濈紒璇茬墕椤曪絾绻濆顓炰簻缂佺偓濯芥ご鎼佸疾閿濆鍋℃繝濠傚暟鏁堥梺璇″枟閿曘垽骞婇悩娲绘晢闁稿本绮g槐鏌ユ⒑閸濆嫷妲搁柣妤€瀚板畷婵囨償閿濆洣绗夐梺缁樺姉閸庛倝鎮″☉銏″€堕柣鎰硾琚氶梺鍝ュУ閿曘垽寮婚埄鍐╁闁荤喐婢橀~鎺楁倵鐟欏嫭绀堥柛鐘崇墵閵嗕礁顫滈埀顒勫箖閳哄懏鎯炴い鎰╁€濋幏濠氭⒒閸屾艾鈧嘲霉閸パ呮殾闁割煈鍋呴崣蹇涙煙閹澘袚闁抽攱姊婚埀顒€绠嶉崕閬嵥囬鐐插瀭闁稿瞼鍋為悡銏′繆椤栨粌鐨戠紒杈ㄥ哺閺屻劌鈹戦崱鈺傂︾紓浣插亾閻庯綆鍋佹禍婊堟煛瀹ュ啫濡块柍钘夘槹缁绘盯宕奸悢铏圭厜濠殿喖锕ㄥ▍锝呪槈閻㈢ǹ宸濇い鏂惧嫎閳ь剚鍔曢—鍐Χ鎼粹€茬凹濠电偠灏欓崰鏍х暦濞差亜鐒垫い鎺嶉檷娴滄粓鏌熼崫鍕棞濞存粓绠栧娲箰鎼淬垻鈹涙繝纰樷偓铏悙閸楅亶鏌熼悧鍫熺凡缂侇偄绉归弻娑㈩敃閿濆洨鐣煎銈嗘尰濡炶棄顫忛搹鍦<婵☆垰鎼~宀勬倵濞堝灝娅橀柛鎾寸懆閻忓啴姊洪崨濠佺繁闁哥姵宀稿畷銏ゅ箹娴e厜鎷洪梺鍛婃尰瑜板啯绂嶆禒瀣厱閻庯綆浜滈顓㈡煙椤旀枻鑰块柡浣稿暣瀹曟帒鈽夊顒€绠為梻浣筋嚙閸戠晫绱為崱娑樼;闁糕剝蓱濞呯姵銇勯幒鎴濃偓鑽ゅ婵傚憡鐓曢悘鐐插⒔閳藉绱掑锕€娲﹂悡娆撴煟閻斿憡绶叉い蹇e弮閺岀喖鎮℃惔銏g闂佺懓寮堕幐鍐茬暦閻斿吋顥堟繛鎴炵懄閻濓繝姊婚崒姘偓鎼佸磹妞嬪海鐭嗗〒姘e亾妤犵偞鐗犻、鏇㈠Χ閸屾矮澹曞┑顔矫畷顒勫储鐎电硶鍋撶憴鍕缂傚秴锕濠氬幢濡ゅ﹤鎮戦梺鍛婁緱閸ㄧ晫妲愰柆宥嗙厽閹艰揪绱曢悾顓㈡煕鎼淬劋鎲鹃挊婵喢归崗鍏肩稇缁炬崘娉曢埀顒€绠嶉崕閬嵥囨导瀛樺亗闁哄洢鍨洪悡娑㈡煕閵夛絽鍔氬┑锛勫帶椤儻顧侀柛銊ゅ嵆濠€渚€姊虹紒妯撳湱绮旈鈧、鏃堝醇閻旇櫣鏆㈤梻鍌氬€烽悞锔锯偓绗涘懏宕查柛灞绢嚤濞戞鏃堝川椤撶姴骞掗梻浣告惈濞层垽宕瑰ú顏呭亗闁告劦浜濋崰鎰節婵犲倻澧曠紒鈧崼鐔稿弿婵☆垱瀵х涵楣冩煢閸愵亜鏋涢柡灞炬礃缁绘稖顦查悗姘卞厴瀹曟垿濡搁埡鍌楁嫼缂傚倷鐒﹂敋濠殿喖娲﹂妵鍕即閵娿儱绫嶉梺绯曟杺閸ㄨ棄顕i幘顔碱潊闁炽儲鏋奸崑鎾绘偨閸涘﹦鍙嗗┑鐘绘涧濡鍩€椤掑倹鍤€闁宠绉瑰畷鍫曞Ω閿濆嫮鐩庨梻濠庡亜濞诧妇绮欓幇鏉跨疅濡わ絽鍟悡娑㈡倶閻愰潧浜剧紒鈧€n兘鍋撶憴鍕濞存粌鐖奸妴浣割潨閳ь剟骞冮姀锛勯檮濠㈣泛顦辨径锟�

    重磅专题
    往期文章
    最新文章